概率分布

Probability Distribution

概率分布描述随机变量可能取哪些值,以及这些值按什么概率出现。它既可以是离散的概率表,也可以是连续的密度曲线;统一的入口是分布函数 F(x)=P(Xx)

定义

X 是离散随机变量,取值为 x1,x2,,对应概率为 p1,p2,,则

pi0,ipi=1,P(X=xi)=pi.

X 是连续随机变量,则通常用概率密度函数 p(x) 描述分布:

p(x)0,p(x)dx=1,F(x)=xp(t)dt.

连续分布中,一个精确点的概率为零:

P(X=c)=ccp(x)dx=0.

真正有概率意义的是区间:

P(aXb)=abp(x)dx=F(b)F(a).

分布函数与密度

分布函数 F(x)=P(Xx) 总是单调不减、右连续,并满足

limxF(x)=0,limx+F(x)=1.

对连续分布,密度是分布函数的导数:

p(x)=F(x)

F 可导的位置成立。反过来,密度曲线下从 ab 的面积就是区间概率。需要区分:p(x) 本身是单位长度上的概率强度,不是 P(X=x)

均匀分布例子

若年龄在 1720 之间均匀分布,则每个长度相同的区间具有相同概率。分布函数和密度为

F(x)={0,x17,x173,17<x<20,1,x20,p(x)={13,17<x<20,0,otherwise.

因此

P(18X19)=F(19)F(18)=13.

这个分布的中心在区间中点:

m=E[X]=18.5,F(m)=F(18.5)=12,

方差为

σ2=(2017)212=34.

一般地,若 X[0,a] 上均匀分布,则

p(x)=1a,F(x)=xa(0xa),

并且

m=E[X]=a2,σ2=Var(X)=a212.

均值、方差与线性变换

离散分布的均值和方差为

m=E[X]=ipixi,σ2=E[(Xm)2]=ipi(xim)2.

连续分布中,求和变为积分:

m=E[X]=xp(x)dx,σ2=(xm)2p(x)dx.

若新变量由线性变换给出

Xnew=aXold+b,

mnew=amold+b,Var(Xnew)=a2Var(Xold).

平移只改变中心位置,缩放会按平方改变方差。

常见分布的连接

二项分布描述 N 次独立 0/1 试验中的成功次数。公平硬币下,成功次数的均值为 N/2,方差为 N/4;当 N 增大时,经中心化和标准化后会趋近正态分布

正态分布的标准形式为

p(x)=12πex2/2.

许多独立小误差的和或平均值会通过中心极限定理靠近正态分布,这也是抽样误差和蒙特卡洛方法1/N 误差尺度的来源。

边界条件